Мозг и руки

Основная концепция — Мозг и руки

В наших предыдущих лабораторных работах мы увидели, насколько мощными являются большие языковые модели (LLM), но также выявили серьёзный недостаток: они замкнуты в своей оболочке. Они знают только то, чему их обучили, и не могут взаимодействовать с реальным миром.

Агенты ИИ решают эту проблему, объединяя два разных компонента:

Мозг: Большая языковая модель (например, Qwen3-4B), которая понимает человеческий язык, обрабатывает логику и поддерживает контекст разговора.
Руки: Код на Python и внешние инструменты (API), которые могут активно взаимодействовать с реальным миром — например, проверять погоду, просматривать интернет или выполнять расчёты.

Обучение мозга использованию рук

Большая языковая модель не может естественным образом «нажимать» кнопки или «запускать» код на Python. Сегодня наша цель — научить мозг определять, когда ему нужна помощь, и форматировать свой вывод так, чтобы наша программа на Python могла запустить инструмент за него его.

A clean, modern conceptual illustration showing a glowing digital brain representing an LLM connected via glowing data lines to a pair of robotic or digital hands manipulating code blocks and gears, representing real-world tools. Minimalist tech aesthetic with light blue and soft orange accent colors.